Cơ chế hoạt động Website so sánh giá

Các website so sánh giá hoạt động dựa trên một trong hai phương thức sau:

Crawler

Website so sánh giá xây dựng chương trình phần mềm crawler để truy cập website của các gian hàng trực tuyến, phân tích cấu trúc html và lấy thông tin về giá cũng như các đặc tính khác của sản phẩm. Cách làm này cũng giống như việc các công cụ tìm kiếm như Google đánh giá xếp hạng các website.

Phương thức này có ưu điểm là thông tin về giá của sản phẩm luôn được cập nhật liên tục.

Việc lấy dữ liệu bằng phương thức crawler cũng mang lại nhiều khó khăn cho các website so sánh giá bởi cấu trúc html của các gian hàng trực tuyến không giống nhau, chưa kể tới việc tên gọi của cùng một sản phẩm và mô tả về sản phẩm đó cũng không giống nhau trên các gian hàng. Ngoài ra, việc lấy dữ liệu có thể bị dừng nếu như website của gian hàng bị lỗi hoặc thay đổi cấu trúc.

Feed dữ liệu

Với phương thức này, website so sánh giá sẽ cung cấp một chuẩn định dạng dữ liệu dưới dạng tập tin txt hoặc xml để các gian hàng điền thông tin.

Ưu điểm của phương thức này là thông tin về các sản phẩm được chuẩn hóa đồng bộ hơn.

Tuy nhiên, hạn chế của phương thức này là thông tin sẽ không được cập nhật nếu như gian hàng "quên" gửi dữ liệu cho website so sánh giá, dẫn đến việc thông tin trên website so sánh giá khác với thông tin trên website của gian hàng. Thêm vào đó, các gian hàng có thể không cung cấp thông tin của đủ tất cả các mặt hàng mà chỉ của một số mặt hàng trọng điểm.